其他
推荐系统融合排序的多目标寻优技术
导读 本文将分享推荐系统中融合排序的多目标寻优技术。
分享内容主要分为五个部分:1. 推荐系统中的排序公式以及它在整个系统中的地位
2. 在工作中遇到的业务夹角问题,以及如何进行多目标的权衡
3. 如何通过离线寻参的技术来解决这些问题,以及技术的基本原理
4. 高效的自动寻参框架演示,引导大家实际操作和实践
5. Q&A
分享嘉宾|程引博士 快手 资深算法专家
编辑整理|贻佩
内容校对|李瑶
出品社区|DataFun
推荐系统中的排序公式
一是具有区分度,因为融合公式融合了各种先验信息、预估信号以及业务需求得到的综合评分,若评分没有区分度,那么排序机制将失效。 其次,我们需要最大限度地保留各排序因子的信息量,因为如果融合公式因设计问题而无法保留原始排序因子的信息,就等同于抛失了这个排序因子的信息。 最后一点,若排序公式过于复杂,如包含过多的超参数,这将增加人工调参的难度,使我们可能沉溺于局部最优而无法看清整体趋势,为此,我们将在后续提供一些方法,以减少参数冗余,并更好地理解数据分布,从而更有效地进行参数调整。
业务夹角与多目标权衡
排序公式离线寻参原理
首先,我们很难确保线上调参的质量。由于线上调参实际上是在实时运行的系统中试错,不能使用大规模流量进行广范围的搜索,因此无法有效覆盖整个样本空间。而且,由于这是一个实时交互的过程,结果具有很大的不确定性,且几乎没有试错的空间。因此,使用强化学习在实时交互的环境中进行训练是非常困难和缓慢的。 其次,线上调参的效率无法保证。在线上调参的过程中,我们无法保证系统能快速收敛。而且,由于系统状态在不断变化,无法预知系统的最终状态。考虑到排序公式并无必要实时更新,如果将其视为实时模型,便意味着需要在现有的排序结果中嵌入自己的业务理念。由于排序公式的更新一般并不需要达到分钟级,我们完全有条件进行离线调参。 最后,线上过程很难处理多目标优化问题。如前文所述,多目标优化需要同时考虑价值判断和事实判断,即需要同时考虑上层的业务需求和当前系统的实际状态。在线上环境下难以实现这种优化,因为我们无法进行反复或交叉验证。例如,我们无法获取 A 置换 B、B 置换 C 等等所需的置换难度。而在离线环境下,由于其封闭性,我们可以测定各种置换的边际效益和置换效果。
融合排序量化寻参实战
Q&A
分享嘉宾
INTRODUCTION
程引博士
快手
资深算法专家
上海交通大学博士。在滴滴出行、BizReach、Smartnews 长期从事推荐算法工作,目前在快手从事直播推荐的工作。
往期推荐
GenAI时代的实时数据分析:Apache Pinot与向量索引技术探秘
金融,大模型落地的关键场景!
打造 LLMOps 时代 Prompt 数据驱动引擎
基于大模型的数据治理应用新范式
阿里云智能大数据演进
Agent+Copilot:大模型在智能运维领域的应用
从0到1,掌握大模型RAG技术原理与应用
社交传播和影响力算法在腾讯游戏中的应用实践
多场景多任务统一建模在网易云音乐的算法实践
Data+LLM:数据治理新范式探索
点个在看你最好看
SPRING HAS ARRIVED